SAN Projekt

Soziale Netzwerkanalyse von Schweizer Offshore Firmen in den Pandora Papers

Autor:innen
Zugehörigkeit

Florin Barbisch

Gabriel Torres Gamez

Tobias Buess

Schlüsselwörter

Social Network Analysis, Offshore Companies, Pandora Papers, Swiss Officers, ICIJ Offshore Leaks

Wir führen eine Voranalyse für das Bundesamt für Statistik durch, um die kürzlich aufgetretenen Leaks aus den Offshore Papers zu untersuchen.

Diese Analyse zielt darauf ab, Umfang und Natur der Verbindungen in Schweizer Offshore-Strukturen zu ermitteln. Wir verwenden dafür Daten aus der Offshore Leaks Database, um mögliche Muster und wichtige Personen aufzudecken, die für die Steuerbehörden oder Regulierungsorgane von Interesse sein könnten. Dies wird es dem Bundesamt für Statistik ermöglichen, fundierte Entscheidungen zur weiteren Untersuchung und möglichen Massnahmen zu treffen. Für folgenden Analysen beschäftigen wir uns mit dem Pandora Papers Subset der Offshore Leaks Datenbank auf Grund der Aktualität und unseren beschränkten technischen Ressourcen.

In diesem Notebook führen wir alle Ergebnisse unserer einzelnen Analysen zusammen. Die einzelnen Analysen sind in den Jupyter Notebooks im Repository zu finden.

1 Explorative Datenanalyse

1.1 Struktur der Daten

Die ICIJ Datenbank gibt uns bereits eine gute Visualisierung der Datenstruktur. Hier sehen wir die Edges zwischen den 4 wichtigsten Nodetypen (Node mit Typ Others wurden nicht berücksichtigt). Hier wurden jedoch aus Platzgründen nicht alle Kantenverbindungen oder Selfloops dargestellt:

Nodestruktur von ICIJ

Es gibt einige Edges zwischen Intermediary und Officer, jedoch sind diese eher selten und nicht für unsere Analyse relevant. Die Verbindung zwischen Officer und Intermediary wird stattdessen über die Entity hergestellt.

Hier sehen wir noch alles Nodes per Nodetyp zusammengefasst und die Anzahl Verbindungen zwischen den Nodetypen:

Anzahl Verbindungen zwischen den Nodes

Solang nicht anders spezifiziert dient dieser Graph als Basis für alle weiteren Analysen.

Für die Explorative Datenanalyse haben wir alle Connected Components mit mindestens einer Schweizer Adresse ausgewählt. Somit wird der Plot wie folgt reduziert:

Anzahl Verbindungen zwischen den Nodes im schweizer Subgraph

Hier fallen alle Nodes des Typs Others weg und die Anzahl Connected Components wird von 2643 auf 51 reduziert. Es bleiben um die 85.02% der Nodes erhalten.

1.2 Grösse der Connected Components

Anzahl Nodes pro Connected Components

Es existiert ein grosser Component, welcher fast 100’000 Nodes enthält. Der nächstgrösste Component enthält nur etwa 100 Nodes.

1.3 Density

Für die Analyse der Density machen wir eine Newman’s Weighted Projection auf alle Officers und filtern alle Officers eines Landes heraus. Für den mexikanischen Subgraph sieht das beispielsweise so aus:

Mexikanischer Officer Subgraph

Danach berechnen wir die Density dieses Subgraphes. Aus Platzgründen wurden nur die Länder mit über 1’000 Officers visualisiert.

Density der Landes Officer Subgraphen pro Land

Schweizer Officer scheinen, im Vergleich zu den anderen Ländern mit über 1000 Officers in unserem Datensatz, nicht allzu stark miteinander vernetzt zu sein.

1.4 Group Centrality

Für diese Analyse erstellen wir pro Land eine Global View, bei welcher alle Nodes dieses Landes zu einer Node zusammengefasst werden. Darauf berechnen wir die Degree Centrality und die Closeness Centrality der zusammengefassten Node.

Global View Degree Centrality pro Land

Global View Closeness Centrality pro Land

In Bezug auf lokale Vernetzung (Degree Centrality) und globale Erreichbarkeit (Closeness Centrality) scheinen die schweizerischen Akteure im Vergleich zu anderen Ländern nicht besonders zentral zu sein. Besonders die British Virgin Islands sind im Vergleich zu den anderen Ländern sehr zentral.

2 Welches sind die grössten Officergruppen/Cliquen und wie viel Prozent der Schweizer Officers gehören ihnen an?

Für diese Analyse mergen wir Nodes mit den gleichen Attributen und entfernen parallele Edges mit dem gleichen Verbindungstyp:

Gefilterter Subgraph

Anschliessend wird das Netzwerk mittels einer Unweighted Projection auf die Officer reduziert:

Officer Graph

2.1 Cliquenanalyse

In der folgenden Visualisierung haben wir zwei verschiedene Untervisualisierungen. Die linke zeigt die Häufigkeit der schweizer Officer Ratios in jeder Clique und die rechte zeigt den durchschnittlichen schweizer Officer Ratio pro Cliquengrösse.

Häufigkeit der schweizer Officers pro schweizer Officer Ratio und durchschnittlicher schweizer Officer Ratio pro Maximalclique

In den meisten Cliquen gibt es keine schweizer Officers. Der durchschnittliche Anteil der schweizer Officers (pro Clique) beträgt 0,0227. Es scheint nicht viele interessante Muster zu geben. Interessant ist, dass es nicht viele Cliquen gibt, in denen das Verhältnis der schweizer Officers nahe bei 1 liegt.

2.2 Label Propagation Analyse

Ähnlich zum Plot oben wurden hier Gruppen im Officer-Netzwerk identifiziert. Allerdings nicht durch Cliquen, sondern durch den Label-Propagation-Algorithmus. Es sind hier die gleichen zwei Visualisierungen wie oben zu sehen.

Häufigkeit der schweizer Officers pro schweizer Officer Ratio und durchschnittlicher schweizer Officer Ratio pro identifizierter Gruppe gemäss Label-Propagation-Algorithmus

Die linke Visualisierung ist sehr ähnlich wie die linke Visualisierung der Cliquenanalyse. Die rechte Visualisierung zeigt jedoch, dass es grössere Gruppen gibt als bei der Cliquenanalyse. Hier wird auch ersichtlich, dass die grösseren Gruppen z.T. auch einen höheren Anteil an schweizer Officers haben.

2.3 Modularity Analyse

Gleich wie die beiden Visualisierungen oben wurden hier Gruppen im Officer-Netzwerk identifiziert. Allerdings durch den Modularity-Algorithmus nach der Clauset-Newman-Moore-Methode. Dabei geht es darum, Gruppen zu bilden und in diesen die Modularität zu maximieren, indem die Knoten immer einer anderen Gruppe zugeordnet werden, um zu testen, ob sich die Modularität erhöht. Wenn dies der Fall ist, wird der Knoten in die neue Gruppe verschoben. Im Gegensatz zum Louvain-Algorithmus, werden die Gruppen nicht zu einem neuen Graphen zusammengefasst (jede Gruppe wird zu einem Knoten), wenn die Modularität maximiert ist.

Häufigkeit der schweizer Officers pro schweizer Officer Ratio und durchschnittlicher schweizer Officer Ratio pro Communit welche nach Modularitätsmaximierung gefunden wurde

Durch die Modularity-Maximierung werden noch grössere Gruppen gefunden als bei der Analyse mit dem Label-Propagation-Algorithmus. Auf weitere Erkenntnisse lässt sich jedoch nicht schliessen, da der linke Plot sehr ähnlich zu den linken Plots der beiden anderen Analysen ist.

2.4 Connected Components Analyse

In der linken Visualisierung sehen wir das Verhältnis der schweizerischen Officers zur Anzahl der Connected Components. In der rechten Visualisierung sehen wir das durchschnittliche Verhältnis der schweizerischen Officers pro Grösse der Connected Components.

Anzahl der Connected Components pro schweizer Officer Ratio und durchschnittlicher schweizer Officer Ratio pro Connected Component Grösse

Das Verhältnis von schweizerischen Officers pro Connected Component ist in den meisten Fällen sehr niedrig. Die Plots sehen dem Plot der Cliquenanalyse sehr ähnlich und es können keine interessanten Erkenntnisse daraus gezogen werden.

2.5 Louvain Analyse

Diese Analyse ist sehr ähnlich zur Modularity-Analyse, jedoch wird hier der Louvain-Algorithmus verwendet. Das heisst, dass die Gruppen zu einem neuen Graphen zusammengefasst werden, wenn die Modularität maximiert ist und der Algorithmus wird wiederholt bis die Modularität nicht mehr erhöht werden kann oder ein Abbruchkriterium erreicht ist.

Häufigkeit der schweizer Officers pro schweizer Officer Ratio und durchschnittlicher schweizer Officer Ratio pro Community welche nach dem Louvain Algorithmus gefunden wurde

Die rechte Grafik zeigt sehr gut, dass die gefundenen Communities zwar Ähnlichkeiten zu den Gruppen in der Modularity-Analyse haben, jedoch auch Unterschiede aufweisen. So sind hier die grösseren Gruppen nicht ganz so gross wie bei der Modularity-Analyse.

2.6 Konklusion

Es wurde festgestellt, dass Schweizer Officers in den grösseren internationalen Netzwerken von Offshore-Unternehmen eine relativ geringe Rolle spielen. Die Homogenität der Nationalitäten innerhalb der grössten Cliquen und Gemeinschaften (siehe entsprechendes Notebook) deutet darauf hin, dass diese Netzwerke bei einer sehr strengen Definition von Cliquen hauptsächlich von Beamten aus einem Land dominiert werden. Werden die Bedingungen jedoch gelockert, werden die Netze heterogener.

3 Wie intensiv ist die Zusammenarbeit zwischen den Officers verschiedener Länder? Wie gut schneidet die Schweiz dabei ab?

Für diese Analyse werden alle Nodes ausser Officers und Entities herausgefiltert und mit ähnlichen Attributen gemerged:

Officer-Entitäten Graph

Anschliessend wird auf das Netzwerk eine Newman’s Weighted Projection auf die Officers durchgeführt:

Officer Graph

Danach werden alle Officers eines Landes zu einer Global View zusammengefasst wobei die Interaktionsstärke (Edge Weights) zwischen den Ländern aufaddiert wurde:

Country Graph

Im finalen Graph gibt es keine Self-loops und jeweils nur eine Kante zwischen den Nodes, wessen Gewicht die Interaktionsstärke zwischen den Officern zweier Länder repräsentiert.
Im nächsten Plot ist ein Ausschnitt des resultierenden Netzwerkes ersichtlich.

3.1 Interaktionsstärke zwischen den Ländern

Interaktionsstärke zwischen den Ländern

Visualisieren wir nun alle Nodes und Edges mit einem Edge Weight > 10, so ist gut ersichtlich, dass viele Verbindungen von dem Vereinigtes Königreich (GBR) aus gehen. Auch interessant sind Russlands Verbindungen mit der Ukraine, Belarus und Israel.

Betrachten wir die Schweiz, so sind Verbindungen zwischen den Vereinigten Arabischen Emiraten, Zypern, Virgin Islands (British), Litauen und Russland ersichtlich.
Nachfolgend wird die totale Interaktionsstärke eines Landes mit dem Ausland, der Grösse nach sortiert dargestellt (einfach gesagt die Summe der Edge-Weights im obigen Plot).

Totale Interaktionsstärke nach Land

Im oberen Plot dargestellt ist die totale Interaktionsstärke (Summe aller Edge-Weights) der Officers der einzelnen Länder.
Die Schweiz befindet sich auf dem fünften Platz (Rang = 5).

In den nachfolgenden Hypothesentests wird überprüft ob die Interaktionsstärke der Schweiz statistisch signifikant ist oder ob die Schweiz nur zufällig so gut abschneitet.

3.2 Hypothesentest

Um zu bestimmen ob die Interaktionsstärke der Schweiz mit den anderen Ländern statistisch signifikant ist, führen wir einen Hypothesentest durch:

  • Im Hypothesentest wird überprüft, ob der Rang der Schweiz bezüglich Interaktionsstärke mit den anderen Ländern statistisch signifikant ist (Irrtumswahrscheinlichkeit = 5%).
  • Auch die Interaktionsstärke selbst wird auf statistische Signifikanz überprüft.

Der Hypothesentest wird durch einen Permutationstest durchgeführt.
Die gesamte Interaktionsstärke mit dem Ausland wird durch den Weighted Node Degree berechnet (Summe aller Edge-Weights einer Node).
Anschliessend werden die Kantengewiche des Netzwerks zufällig vertauscht und die Interaktionsstärke und Rang der Schweiz neu berechnet. Diese Permutation wird 20’000 mal durchgeführt um die Verteilung der Interaktionsstärke zu simulieren.

Distribution des Rangs der Schweiz in Hinsicht auf die Interaktionsstärke in zufälligen Graphen

Im obigen Plot sind die Ränge der Interaktionsstärke der Schweiz in zufälligen Graphen als Histogramm visualisiert. Die zufälligen Graphen wurden durch einen Permutationstest mit 20.000 Durchläufen erstellt. Nach jedem Durchlauf wurde der Rang der Schweiz neu berechnet. Dadurch kann der Rang der Schweiz in zufälligen Graphen simuliert werden und herausgefunden werden, in wie vielen Fällen der zufällige Rang kleiner oder gleich dem Rang im ursprünglichen Graphen ist. Dieses Histogramm zeigt die Verteilung des Ranges der Schweiz in zufälligen Graphen. Die rote Linie repräsentiert den Rang im ursprünglichen Graphen. Je weniger blaue Fläche sich links von der Linie befindet, desto kleiner ist der p-Value und somit auch die Irrtumswahrscheinlichkeit.

Mit einem p-Value von weniger als 0,05 ist der ursprüngliche Rang von 5 statistisch signifikant.
Das p-Value zeigt, dass H_0 abgelehnt und H_1 angenommen werden kann.

\begin{align*} H_0 &: r \geq r_{\text{zufällig}} \\ H_1 &: r < r_{\text{zufällig}} \end{align*}

Somit kann behaupten werden, dass die Schweiz zu den Spitzenreitern bezüglich der Interaktionsstärke mit anderen Ländern gehört.

Distribution der schweizer Interaktionsstärke in zufälligen Graphen

Im obigen Plot ist die Verteilung der Interaktionsstärke (Edge Weight) der Schweiz in zufälligen Graphen als Histogramm dargestellt. Diese zufälligen Graphen wurden ebenfalls durch einen Permutationstest mit 20.000 Durchläufen erstellt. Die rote Linie repräsentiert die Interaktionsstärke der Schweiz im ursprünglichen Graphen. Je weniger blaue Fläche sich rechts von der roten Linie befindet, desto besser, da dies einen kleineren p-Value und somit eine geringere Irrtumswahrscheinlichkeit bedeutet.

Bei Betrachtung des p-Value ist auch die Interaction Strength selbst statistisch signifikant.
H_0 kann abgelehnt und H_1 angenommen werden.

\begin{align*} H_0 &: \text{Interaktionsstärke} \leq \text{Interaktionsstärke}_{\text{zufällig}} \\ H_1 &: \text{Interaktionsstärke} > \text{Interaktionsstärke}_{\text{zufällig}} \end{align*}

4 Welche Schweizer Officers haben die meisten Offshore Firmen?

Für diese Analyse nehmen wir wieder den Subgraphen mit den Connected Components welche mindestens eine Schweizer Adresse beinhalten:

Gefilterer Subgraph

Wir mergen auch Nodes, welche identische Attribute beinhalten:

Subgraph mit gemergten Nodes

Danach filtern wir alle schweizer Officers heraus und deren Entitäten:

Subgraph der schweizer Officers und deren Entitäten

Danach suchen wir die Officers, mit der höchsten Anzahl Verbindungen an Offshore Firmen (Entity Out-Degree) und stellen diese dar:

4.1 Ruslan Goryukhin Ego Graph

Ruslan Goryukhin hat ein Entity Out-Degree von 28. Er hat somit Verbindungen zu den meisten Offshore Firmen. Er ist vorallem bei vielen Offshore Firmen als “Ultimate Beneficial Owner” eingetragen. Ruslan Goryukhin ist ein russischer Unternehmer, welcher zum Zeitpunkt der Pandora Papers Leaks in der Schweiz wohnhaft war. Nach folgender Quelle ist er “[…] ein enger Geschäftspartner von Arkadij Rotenberg, der wiederum ein Vertrauter von Wladimir Putin ist”. Falls er noch in der Schweiz wohnhaft ist, könnte dies für die Schweizer Behörden von Interesse sein, vorallem wegen den aktuellen Sanktionen gegen Russland wegen des Ukraine-Konflikts.

Ego Graph von Ruslan Goryukhin

4.2 Adrian Guldener Ego Graph

Adrian Guldener hat einen Entity Out-Degree von 27, nicht weit von Goryukhins 28 entfernt. Adrian Guldener ist ein Schweizer Staatsbürger, wohnhaft in Zug. Er ist bei weniger Entitäten beteiligt, jedoch hat er mehr Verbindungen zu diesen Entitäten. Er ist vorallem bei vielen Offshore Firmen als “Shareholder” und “Beneficial Owner” eingetragen. Adrian Guldener ist CEO der Wealth Management Firma Marcuard Heritage und war von 2001 bis 2003 Executive Director of UBS Private Banking Eastern Europe in Zürich.

Nach einer Google Suche scheint es so, als wäre Adrian Guldener nicht in konkrete Skandale verwickelt.

Ego Graph von Adrian Guldener

4.3 Alexander Studhalter Ego Graph

Alexander Studhalter hat einen Entity Out-Degree von 15. Alexander Studhalter ist ein Anwalt und Notar aus Zug. Er ist vorallem bei vielen Offshore Firmen als “beneficial owner” eingetragen. Sein Unternehmen “Studhalter International Group AG” handelt nach einigen Angaben rund 1,5 Mrd. CHF an Assets. Er wurde 2022 von der USA saktioniert, weil er mit der Tochter eines bereits sanktionierten Oligrachen gehandelt hat.

Ego Graph von Alexander Studhalter

5 Haben schweizer Officer mehr Firmen zusammen mit anderen schweizer Officers oder mit ausländischen Officers?

Für diese Analyse werden alle Nodes ausser Officers und Entities herausgefiltert und Nodes mit ähnlichen Attributen gemerged:

Officer-Entitäten Graph

Anschliessend wird eine Unweighted Projection auf die Officers durchgeführt (Officer-Officer Graph).
Wenn zwei Officers also mindestens einmal zusammen im Vorstand einer Firma sassen, so besitzen diese im Projected Graph (Officer-Officer Graph) eine Verbindung:

Officer Graph

In einem ersten Schritt wird überprüft, ob Officers vom gleichen Land eher im Vorstand einer Firma sitzen oder nicht.
Dazu wird die Pearson Korrelation als Metrik verwendet.

5.1 Korrelation zwischen den Officerbeziehungen und Ländern

Um einen Hypothesentest auf der Korrelation zwischen Landeszugehörigkeit und Interaktion zwischen den Officers durchzuführen, wird ein weiterer Graph mit den Officer Nodes erstellt.
Bei diesem besitzen die Officer Nodes nur dann eine Edge, wenn sie Teil vom gleichem Land sind (Same Country Graph):

Officer Graph, wobei die Edges auf das gleiche Ursprungsland zurückweisen

Diese zwei Graphen werden dann für einen Dyadischen Hypothesentest verwendet, um zu überprüfen, ob die Pearson Korrelation zwischen dem Officer-Officer Graph und dem Same Country Graph statistisch signifikant ist, wobei wir uns auf eine Irrtumswahrscheinlichkeit von 5% beziehen.

Distribution der Pearson Korrelation zwischen Interaktionsgraph und Land der Offiziere

Im obigen Plot ist die Verteilung der Pearson Korrelation zwischen Interaktion und der Landeszugehörigkeit der Officers in zufälligen Graphen als Histogramm dargestellt. Diese zufälligen Graphen wurden durch einen Permutationstest mit 10.000 Durchläufen erstellt. Die rote Linie repräsentiert die Pearson Korrelation im ursprünglichen Graphen. Es ist deutlich zu sehen, dass sich die zufälligen Korrelationen viel weiter links von der Original-korrelation befindet.
Auch das p-Value von 0.000 zeigt, dass es sich dabei um eine signifikante Korrelation handlet.

Allerdings ist unsere Korrelation von ~0.03 relativ schwach, weshalb nicht von einem grossen Zusammenhang zwischen Interaktion und Landeszugehörigkeit gesprochen werden kann.

\begin{align*} H_0 &: \text{Officer\ Interaktion} \leq \text{Officer\ Interaktion}_{\text{zufällig}} \\ H_1 &: \text{Officer\ Interaktion} > \text{Officer\ Interaktion}_{\text{zufällig}} \end{align*}

Das p-Value zeigt, dass H_0 abgelehnt und H_1 angenommen werden kann.

5.2 Haben schweizer Officers mehr Verbindungen zu anderen schweizer Officers oder zu ausländischen Officers?

In diesem Hypothesentest wird das Verhältnis zwischen den Interaktionen schweizer Officers mit anderen schweizer Officers (Interaktion = Beide Officers sitzen im gleichen Vorstand einer Firma) und der totalen Anzahl Interaktionen schweizer Officers zu Officers von anderen Ländern als Zielmetrik verwendet.

Diese soll Aufzeigen, wieviel Prozent der Interaktionen innerhalb der Schweiz bleiben und wieviele ins Ausland gehen. Hier wird auch eine Irrtumswahrscheinlichkeit von 5% festgelegt.

Dafür wird eine Global View aus dem Officer-Officer-Graphen erstellt, bei welchen alle Nodes des gleichen Landes in eine Node gemerged werden und Selfloops beibehalten werden.

Verteilung des Interaktionsverhältnisses (wie viele Schweizer Beamte sind miteinander verbunden / alle Verbindungen der Schweizer Beamten) in zufälligen Graphen

Im obigen Plot ist die Verteilung des Verhältnisses der Anzahl Verbindungen zwischen schweizer Officers und totale Anzahl Verbindungen von schweizer Officers zu erkennen.
Das Histogram zeigt dabei die Verteilung des Verhältnisses bei zufälligen Graphen.

Das Verhältnis von 0.235 bedeutet, dass die schweizer Officers nur zu 23.5% mit anderen inlänischen Officers zusammen eine Offshore-firma führen.
Bedeutet also ein Grossteil sitzt mit ausländischen Officers im Vorstand einer Firma.

\begin{align*} H_0 &: \text{Verhältnis} \leq \text{Verhältnis}_{\text{zufällig}} \\ H_1 &: \text{Verhältnis} > \text{Verhältnis}_{\text{zufällig}} \end{align*}

Der Hypothesentest zeigt allerdings, dass das erhaltene Ergebnis nicht statistisch signifikant ist und somit H_0 nicht abgelehnt werden kann.